#optimización por refuerzo

Mejora del alineamiento de representaciones visuales con GRPO

Descubre cómo VRPO mejora el alineamiento de representaciones en difusores mediante optimización por refuerzo, logrando +1.8 FID y 2.3x más rápido que REPA.

2026-06-02 · 1 min